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(S) Verfahren und Einrichtung zur Erhohung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen 

® Die Erfindung betrifft ein Verfahren zur Erhohung der 
Erkennungswahrscheinlichkeit von Spracherkennungssy- 
stemen. Das Verfahren beruht darauf, dafi nach Eingabe 
eineszu erkennenden Begriffswahlweise ein Nachtrainte- 
ren des gieichlautenden bereits abgespeicherten Beg riffs 
erfofgt. Damit wird erreicht, da(^ die sprecherabhangige 
Erkennungsrate auch in akustisch gestdrten Umgebun- 
gen verbessert wird. 
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Beschreibung 



Die Erfindung betrifft ein Verfahren und eine Einrichtung 
zur Erhohung der Erkennungswahrscheinlichkeit von 
Spracherkennungssystemen gemaB dem Oberbegriff des Pa- 
tentanspruchs 1. 

Spriacherkennungssysteme werden heute vor allem in 
Computem, Kommunikationssystemen und anderen techni- 
schen Geraten eingesetzt, wo es auf leichte Bedienbarkeit 
Oder schnelle Dateneingabe ankommt. Die bisher bekannten 
Systeme sind jedoch nicht ausgereift und arbeiten fehler- 
haft, insbesondere wenn sie in akustisch gestorten Umge- 
bungen betrieben werden. Ein zu erkennendes Wort wird 
dann oft falsch oder gar nicht erkannt. Dies erfordert vom 
Benutzer ein mehrfaches Wiederfiolen des zu erkennenden 
Wortes, was bei einem haufigen Auftreten eines Erken- 
nungsfehlers zu unzumutbaren Verzogerungen fuhrt. 

Der vorliegenden Erfindung liegt deshalb die Aufgabe zu- 
grunde, ein Verfahren und eine Einrichtung zur Spracher- 
kennung derart weiterzubilden, daB die sprecherabhangige 
Erkennungswahrscheinlichkeit, insbesondere in akustisch 
gestorten Umgebungen, erhoht wird. 

Diese Aufgabe wird durch die kennzeichnenden Merk- 
male des Patentanspruchs 1 gelost. 

Vorteilhafte Abwandlungen und Weiterbildungen der Er- 
findung sind Gegenstand der abhangigen Patentanspruche. 

ErfindungsgemaB wird flir Spracherkennungssysteme ein 
Nachtrainieren der Sprachmuster neu eingegebener, mogli- 
cherweise falsch erkannter oder gar nicht erkannter Begriffe 
vorgeschlagen. Nachtrainieren bedeutet, daB ein falsch oder 
nicht erkannter BegrifiF nach wiederholter Eingabe nicht ein- 
fach iiberschrieben wird, sondem mit den zuvor eingegebe- 
nen Begriffen verglichen und korreliertbzw. durch ein neues 
Muster erganzt wird. um so fiir die Erkennung des Begriffs 
unwichtige Muster oder Nebengerausche zu reduzieren oder 
auszublenden. Die Erfindung ist insbesondere fur den Ein- 
satz in Spracherkennungssystemen gedacht, die in akustisch 
gestorten Umgebung arbeiten, z. B. in Mobilfunkendgera- 
ten, Telefonen etc. 

Bei erfolgreicher Erkennung eines bereits als Sprachmu- 
ster abgelegten Begriffs wird das abgelegte Sprachmuster 
mit dem neu aufgezeichneten nachtrainiert Diese Nachtrai- 
nieren erfolgt bei erfolgreicher Erkennung eines jeden be- 
reits aufgezeichneten Begriffs n-mal, wobei die 2^1 der 
Durchlaufe firei einstellbar und jederzeit veranderbar ist. 
Durch dieses Nachtrainieren wird eine stetige Verringerung 
des Einflusses von variablen Nebengerauschen auf das ei- 
gentliche, konstante Sprachmuster eines Wortes erreicht. 

GemaB einer Weiterbildung der Erfindung erfolgt bei un- 
sicherer Erkennung eines Wortes eine emeute Eingabeauf- 
foriderung, die zum Nachtrainieren genutzt wird. Auch hier 
ist die maximale Zahl der Durchlaufe frei einstellbar und je- 
derzeit veranderbar. Wenn der Vergleich eines eingegebenen 
Sprachmusters mit abgelegten Sprachmustem eine ahnliche 
und wenig differenzierte Wahrscheinlichkeit der Erkennung 
fur mehrere abgelegte Begriffe ergibt, werden dem System- 
benutzer diese Begriffe vorgespieit und er wird aufgefor- 
dert, den anfangs eingegebenen Begriff nochmals zu spre- 
chen. Bei dann erfolgreicher Erkennung wird das Nachtrai- 
ning abgebrochen. Aus Griinden der tJbersichtlichkeit wird 
bevorzugt, bei unsicherer Erkennung die Anzahl der vom 
System ausgegebenen in Frage kommenden Begriffe auf 
eine vorgegebene Anzahl zu begrenzen und die Wederho- 
lung des Vorgangs auf z. B. drei unmittelbare Wiederholun- 
gen zu begrenzen. 

Eine andere Weiterbildung sieht vor, daB bei einem Neu- 
eintrag eines Wortes bzw. Begriffs im System, nach Eingabe 
des neuen Begriffs, ein Vergleich mit bereits gespeicherten 



Begriffen erfolgt. Das Spracherkennungssystem wird also 
dazu genutzt, um einen neuen Begriff mit bereits abgelegten 
Begriffen zu vergleichen und festzustellen, ob sich das 
Sprachmuster des neuen Begriffs so weit von den Sprach- 

5 mustem der bereits abgelegten Begrifife unterscheidet, daB 
keine Fehlerkennung bzw. unsichere Erkennung erwartet 
wird. Fiitirt jedoch das neue Sprachmuster im Rahmen eines 
Korrelationsvergleichs nach einem festgelegten Kriterium 
einer unsicheren Erkennung zu einer starken Ahnlichkeit 

10 Oder wahrscheinlichen Ubereinstinmiung mit bereits abge- 
legten Sprachmustem, so wird der Benutzer vom System 
optisch oder akustisch informiert und zu einer wiederholten 
Eingabe des neuen Begriffs aufgefordert, die dem Nachtrai- 
nieren dient. Die Anzahl der aufeinanderfolgenden Wieder- 

15 holungen ist frei wahlbar und jederzeit veranderbar. 

Im folgenden wird die Erfindung anhand mehrerer Zeich- 
nungsfiguren naher erlautert. Aus den Zeichnungsfiguren 
und der zugehorigen Beschreibung ergeben sich weitere 
Merkmale der Erfindung. Es zeigt: 

20 Fig, 1 schematisches Ablaufdiagramm des erfindungsge- 
maSen Verfahrens am Beispiel eines in einem Mobilfiinkge- 
rat eingesetzten Spracherkennungssystems; 

Fig, 2 schematisches Ablaufdiagramm des Verfahrens bei 
der Verarbeitung von Neueintragen. 

25 Anhand der Zeichnungsfiguren wird das erfindungsge- 
maBe Verfahren in Verbindung mit einem Mobilfiinkgerat 
mit Spracherkennungsfunktion naher beschrieben. Es wird 
von einem Mobilfunkgerat mit Spracherkennung und 
Sprachausgabe ausgegangen. Das Mobilfunkgerat besitzt 

30 ein Telefonbuch mit Namenseintragen denen jeweils eine 
entsprechende Rufnunmier zugeordnet ist. Durch Sprach- 
eingabe eines im Telefonbuch abgelegten Namens kann der 
Benutzer einen Wahlvorgang oder eine andere Aktion auslo- 
sen. 

35 GemaB Fig. 1 wird nach erfolgreicher Erkennung eines 
bereits als Sprachmuster im Telefonbuch abgelegten Na- 
mens das abgelegte Sprachmuster mit dem neu aufgezeich- 
neten nachtrainiert. Bei unsicherer Erkennung eines Na- 
mens erfolgt eine emeute Eingabeaufiforderung, die zum 

40 Nachtrainieren genutzt wird. 

Die anfangs in Schritt 1 festgesetzte Variable k bzw. kraax 
beschreibt die Anzahl bzw. maximale Anzahl der TVainings- 
durchlaufe. 

Nach Auffordemng zur und Eingabe des Namens, gemaB 
45 Schritt 2, erfolgt in Schritt 3 zunachst ein Vergleich, ob die 
maximale Anzahl der Nachtrainingsdurchlaufe erreicht ist 
Ist dies der Fall, wird gemaB Schritt 4 die Operation abge- 
brochen. Ist die maximale Anzahl der Durchlaufe nicht er- 
reicht, erfolgt durch das Spracherkennungssystem in Schritt 
50 5 ein Vergleich des eingegebenen Namens mit den bereits 
im Telefonbuch gespeicherten Namen. Wird der eingege- 
bene Namen gemaB Schritt 6 sicher erkannt, so wird die 
vom Benutzer gewiinschte Aktion ausgefuhrt, Schritt 7, 
z. B. ein Verbindungsaufbau zum gewunschten Gesprachs- 
55 partner. Welters erfolgt in Schritt 8 ein Nachtrainieren des 
entsprechenden Telefonbucheintrags mit dem zuletzt einge- 
gebenen, als richtig erkannten Namen. Die Aktion ist been- 
det, Schritt 9. 

Wird der eingegebene Namen jedoch nicht sicher erkannt, 
60 und ergibt der Vergleich eines eingegebenen Sprachmusters 
mit abgelegten Sprachmustem gemaB Schritt 6 eine ahnli- 
che und wenig differenzierte Wahrscheinlichkeit der Erken- 
nung flir mehrere abgelegte Namen, dann wird der System- 
nutzer informiert und ihm werden die dem eingegebenen 
65 Namen ahnlichsten Namen vorgespieit, Schritt 10. Der Be- 
nutzer wird in Schritt 11 aufgefordert, den anfangs eingege- 
benen Namen nochmals zu sprechen, Schritt 12. Der Zahler 
k wird um eins erhoht, gemaB Schritt 13, und die Routine 
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springt zurOck zu Schritt 3 und wiederholt ab diesem Schritt. 

GemaB Fig. 2 erfolgt bei einem Neueintrag eines Namens 
in das Telefonbuch ein Vergleich mit den bereits gespeicher- 
ten Namen. Zunachst wird der Schleifenzahler k in Schritt 
20 auf Null gesetzt. 

Der Benutzer wird dann in Schritt 21 zur Eingabe des 
neuen Namens aufgefordert. 

Dann wird in Schritt 22 uberpriift, ob die Anzahi der 
Durchgange den definierten Wert uberschritten hat. 1st dies 
der Fall, wird der neue Namen gemaB Schritt 25 im Telefon- 
buch abgespeichert und das Verfahren beendet, Schritt 26. 

1st der Zahler kleiner als der vorgegebene Wert, so ver- 
gleicht das Spracherkennungssystem in Schritt 23 den neuen 
Namen mit bereits abgelegten Namen. Falls sich gemaB 
Schritt 24 das Sprachmuster des neuen Namens so weit von 
den Sprachmustem der bereits abgelegten Namen unter- 
scheidet, daB keine Fehlerkennung bzw. unsichere Erken- 
nung erwartet wird, so wird der neue Namen gemaB Schritt 
25 im Telefonbuch abgespeichert und das Verfahren been- 
det, Schritt 26. Fiihrt jedoch das neue Sprachmuster im Rah- 
men eines Korrelationsvergleichs nach dem festgeleglen 
Kriterium einer unsicheren Erkennung zu einer starken 
Ahnlichkeit oder wahrscheinlichen Ubereinstimmung mit 
bereits abgelegten Namen, so wird der Benutzer in Schritt 
27 vom System optisch oder akustisch informiert und in 25 
Schritt 28 zu einer wiederholten Eingabe des neuen Namens 
aufgefordert. Der neue Namen kann nochmals eingegeben 
werden, Schritt 29. Die wiederholte Eingabe dient gemaB 
Schritt 30 dem Nachtrainieren. Die Anzahi der aufeinander- 
folgenden Wederholimgen ist frei wahlbar und jederzeit 30 
veranderbar. Nach jedem Durchlauf wird gemaB Schritt 31 
der Zahler um eins erhoht, und die Routine springt zuriick zu 
Schritt 21. 
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gespeicherten Begriffen erfolgt, um festzustellen, ob 
sich das Sprachmuster des neuen Begrififs so weit von 
den Sprachmustem der bereits abgelegten BegriflFe un- 
terscheidet, daB keine Fehlerkennung bzw. unsichere 
Erkennung erwartet wird. 

7. Verfahren nach einem der vorheigehenden Ansprii- 
che, dadurch gekennzeichnet, daB wenn der neue Be- 
griff im Rahmen eines Korrelationsvergleichs nach ei- 
nem festgelegten Kriterium zu einer unsicheren Erken- 
nung Oder zu einer starken Ahnlichkeit oder wahr- 
scheinlichen Ubereinstimmung mit bereits abgelegten 
Begriffen fiihrt, der Benutzer vom System optisch oder 
akustisch informiert und zu einer wiederholten Eingabe 
des neuen Begriffs aufgefordert wird, die dem Nacht- 
rainieren dient. ^ 

8. Verfahren nach einem der vorhergehenden Anspru- 
che, dadurch gekennzeichnet, daB die Anzahi der 
Durchlaufe des Nachtrainings beliebig einstellbar sind. 



Hierzu 2 Seite(n) Zeichnungen 



Patentanspriiche 35 

1. Verfahren zur Erhohung der Erkennungswahr- 
scheinlichkeit von Spracherkennungssystemen, da- 
durch gekennzeichnet, daB nach Eingabe eines zu er- 
kennenden Begriffs wahlweise ein Nachtrainieren des 40 
gleichlautenden bereits abgespeicherten Begriffs an- 
hand des eingegebenen Begriffs erfolgt. 

2. Verfahren nach Anspruch 1, dadurch gekennzeich- 
net, daB das Nachtrainieren auf einem Vergleich durch 
Konelation des eingegebenen Begriffs mit dem gleich- 45 
lautenden, bereits abgespeicherten Begriffs basiert, 
wobei die jeweils charakteristischen Sprachmuster er- 
mittelt und abgespeichert werden, 

3. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, daB bei unsicherer Er- 50 
kennung des zu erkennenden Begriffs eine emeute Ein- 
gabeaufforderung erfolgt 

4. Verfahren nach einem der vorhergehenden Ansprti- 
che, dadurch gekennzeichnet, daB wenn ein Vergleich 
eines eingegebenen Begriffs mit den im Spracherken- 55 
nungssystem abgelegten Begriffen eine ahnliche und 
wenig differenzierte Wahrscheinlichkeit der Erken- 
nung fiir mehrere abgelegte Begriffe ergibt, dem Sy- 
stembenutzer diese ahnlichen Begriffe angezeigt oder 
vorgespielt werden und er aufgefordert wird, den an- 60 
fangs eingegebenen Begriff nochmals zu sprechen. 

5. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, daB die Anzahi der ange- 
zeigten Begriffe beliebig vorwahlbar ist. 

6. Verfahren nach einem der vortiergehenden Anspru- 65 
che, dadurch gekennzeichnet, daB bei einem Neuein- 
trag eines Begriffs im Spracherkennungssystem, nach 
Eingabe des neuen Begriffs, ein Vergleich mit bereits 
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